文/观察者网 吕栋
6月23日下午,在德国汉堡国际超算大会(ISC2026)上,新一期全球超算TOP500榜单公布。其中全国产自主研制的“灵晟”超级计算机,以2.19EFlops(每秒10的18次方浮点运算)持续双精度浮点性能登顶。
这不仅是世界首台持续性能超二百亿亿次(2EFlops)的超算系统,也是继2017年“神威·太湖之光”之后,中国超算时隔九年再次重返世界第一。同时,“灵晟”也是全球第五台百亿亿次级超级计算机。
在本次排名中,美国劳伦斯·利弗莫尔国家实验室的El Capitan以1.809 Exaflop/s位列第二,美国橡树岭国家实验室的Frontier以1.353 Exaflop/s位列第三。
国家超级计算深圳中心发文直言,“灵晟”全面领先美欧E级超算,强势宣告中国超算重回世界之巅。
“灵晟”最值得关注的,在于走了一条与当前主流超算不同的路。颁奖仪式上,“灵晟”超算系统总设计师、国家超算深圳中心主任、中山大学教授卢宇彤指出,超算发展已迈入超智融合新阶段,“灵晟”系统首创Online Acceleration的全CPU架构,打破传统CPU-GPU异构架构壁垒,内嵌AI矩阵加速单元,回归计算加速的本质,实现超算智算等多种计算模式的高效协同,全面赋能科学智能计算。
从架构来看,“灵晟”共包含20480个计算节点,每个节点搭载两颗基于ARMv9架构的LX2处理器,运行频率1.55GHz。每颗处理器包含两个计算芯粒,每个芯粒划分为四个NUMA域,每个NUMA域包含38个ARMv9核心和4GB高带宽内存。全系统共计近1400万个CPU核心。节点之间采用国产“灵启”互连技术,以双平面多轨胖树拓扑连接,每节点带宽1.6Tb/s;系统运行麒麟操作系统。
卢宇彤分享到,“灵晟”定位为面向科学工程智能计算的国产全栈融合基础设施:
在芯片层,自研LX2CPU创新性引入多精度与矩阵加速等能力,实现片上超算算力与智能算力深度融合,并集成了首颗国产HBM,内存带宽相比传统CPU提升10倍;在网络层,自主设计的灵启高速互连网络可支持200万个端口、10万节点的超大规模组网;在存储层,采用分层架构,兼顾高性能作业区与容量型数据区,可扩展至E级;在系统层,构建大规模超智融合框架,自研全栈软件,将底层硬件能力以可用、可编程、可优化的方式释放给应用,提高各领域应用性能;在节能方面,首创100%全液冷散热计算机柜,以51GFlops/W能效比,在世界第一的持续性能之上,树立绿色计算新标杆。
全球超算算力排名
超算是拥有极高计算速度和强大并行处理能力的计算系统,专门用于处理科学研究、气候模拟、药物研发、天体物理等需要大量计算的数据密集型任务,可预测天气、模拟台风路径、研发新药、筛选抗癌分子。
上一次中国超算登顶TOP500,是2017年的“神威·太湖之光”。这台安装于国家超级计算无锡中心的集群,以93 Petaflop/s的Linpack成绩位居榜首,并保持了两年半之久,直到2018年春季橡树岭国家实验室的IBM Summit系统问世。“神威·太湖之光”采用中国自主设计的“申威”系列芯片,是全球第一台运行速度超过10亿亿次/秒的超级计算机,峰值性能高达12.5亿亿次/秒,持续性能达到9.3亿亿次/秒。2019年,美国政府对华实施制裁并限制中国获取最强大的芯片,此后中国停止了向TOP500提交Linpack测试结果。尽管中国仍在继续建设超算,但在此后近九年的时间里,TOP500榜首一直由美国和欧洲的系统占据。
如今“灵晟”的登顶,打破了这一局面。
“灵晟”超算系统总设计师、国家超算深圳中心主任、中山大学教授卢宇彤
本次TOP500榜单中,“灵晟”登顶后,其他超算排名均顺延一位。劳伦斯·利弗莫尔国家实验室的El Capitan以1.809 Exaflop/s位列第二,橡树岭国家实验室的Frontier以1.353 Exaflop/s位列第三,阿贡国家实验室的Aurora以1.012 Exaflop/s位列第四,德国于利希超级计算中心的JUPITER Booster以1.000 Exaflop/s位列第五。前十名中有一张新面孔——意大利能源公司埃尼集团的HPC7以571.5 Petaflop/s首次亮相便跻身第六。微软Azure云平台的Eagle系统降至第七,意大利埃尼的HPC6位列第八,日本的Fugaku以442 Petaflop/s位列第九,瑞士的Alps以434.9 Petaflop/s位列第十。
TOP500在新闻稿中指出,超级计算领域的高端架构正呈现出显著的多样性。从全中国自主研发的全CPU架构的“灵晟”,到配备AMD加速器的HPE Cray集群(如El Capitan和Frontier),再到采用英伟达 Grace Hopper架构的JUPITER Booster和Alps,乃至搭载英特尔Ponte Vecchio GPU的Aurora系统,没有哪一种架构占据绝对主导地位。微软的Eagle集群结合了Intel Xeon处理器和Nvidia H100加速器,而日本的Fugaku则基于富士通的A64FX Arm处理器构建。“这份榜单表明,通往领先级计算领域并没有单一的主导技术路径。相反,厂商们正在探索各种CPU、GPU、APU和定制加速器方案,并结合不同的互连和系统设计。”
“灵晟”的登顶,不仅是性能的突破,更是一种技术路线的验证。在AMD与英伟达GPU对华出口禁令持续生效的背景下,中国超算选择了一条不依赖外部GPU的全CPU路径,并在全球最权威的性能榜单上证明了这条路径的可行性。这背后是芯片、互连、存储、系统软件、散热等各个环节的全面自主突破。“灵晟”的价值最终体现在应用上——在大规模并行环境下平均扩展效率84.4%,实现了超过千万核心的全系统高效可扩展运行。从2017年“神威·太湖之光”的93 Petaflop/s到2026年“灵晟”的2.198 Exaflop/s,中国超算在近九年的时间里完成了超过23倍的性能跃升,重新定义了全球超算的算力天花板。
本文系观察者网独家稿件,未经授权,不得转载。